期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. LU分解和Laplace算法在GPU上的实现
陈颖 林锦贤 吕暾
计算机应用    2011, 31 (03): 851-855.   DOI: 10.3724/SP.J.1087.2011.00851
摘要1362)      PDF (736KB)(988)    收藏
随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的。实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果。
相关文章 | 多维度评价
2. 多核CPU和GPU加速分子动力学模拟
林江宏 林锦贤 吕暾
计算机应用    2011, 31 (03): 843-847.   DOI: 10.3724/SP.J.1087.2011.00843
摘要1312)      PDF (810KB)(979)    收藏
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。
相关文章 | 多维度评价